Extraction d'Information et modélisation de connaissances à partir de Notes de Communication Orale. (Information Extraction and knowledge modelling from oral communication notes)
نویسنده
چکیده
In spite of the rise of Information Extraction and the development of many applications in the last twenty years, this task encounters problems when it is carried out on atypical texts such as oral communication notes. Oral communication notes are texts which are the result of an oral communication (meeting, talk, etc.) and they aim to synthesize the informative contents of the communication. These constraints of drafting (speed and limited amount of writing) lead to linguistic characteristics which the traditional methods of Natural Language Processing and Information Extraction are badly adapted to. Although they are rich in information, they are not exploited by systems which extract information from texts. In this thesis, we propose an extraction method adapted to oral communication notes. This method, called MEGET, is based on an ontology which depends on the information to be extracted (“extraction ontology”). This ontology is obtained by the unification of an “ontology of needs”, which describe the information to be found, with an “ontology of terms” which conceptualize the terms of the corpus which are related to the required information. The ontology of terms is elaborated from terminology extracted from texts and enriched by terms found in specialized documents. The extraction ontology is formalized by a set of rules which are provided as a knowledge base for the extraction system SYGET. This system (1) carries out a labelling of each instance of every element of the extraction ontology and (2) extracts the information. This approach is validated in several corpora.
منابع مشابه
Mélusine. Un environnement de modélisation et de coordination de services
RÉSUMÉ. La construction de logiciels à partir de plusieurs applications différentes et hétérogènes est de plus en plus fréquente. Cependant, il n’existe pas à présent une méthodologie de construction pour de tels logiciels. Dans cet article, nous proposons une architecture qui permet de créer des logiciels en faisant collaborer plusieurs services et applications différentes et hétérogènes, util...
متن کاملGestion de l'incertitude dans le cadre d'une extraction des connaissances à partir de texte
Résumé. Le domaine de l’extraction de connaissances à partir de texte nécessite des méthodes permettant de détecter et de manipuler l’incertitude. En effet, de nombreux textes contiennent des informations dont la véracité peut être remise en cause. Il convient alors de gérer de manière efficace ces informations afin de représenter les connaissances de manière explicite. Une première démarche co...
متن کاملModélisation de connaissances pour un système de médiation
Résumé. Travaillant sur l'élaboration d'une méthodologie de développement de systèmes de médiation intégrés dans des systèmes coopératifs, nous avons proposé une architecture à 3 composants : le premier concerne la coopération, le second l'assistance et le troisième est relatif aux connaissances nécessaires aux 2 précédents. Dans cet article nous présentons plus particulièrement le point de vue...
متن کاملTraitement et exploration du fichier Log du Serveur Web pour l'extraction des connaissances : Web Usage Mining
Résumé : Le but dans ce travail consiste à concevoir et réaliser un Outil, en se basant sur l’ECD (Extraction de la Connaissance a partir de bases de données), en utilisant les concepts du Web Usage Mining, pour offrir aux web masters l’ensemble des connaissances, y inclut les statistiques sur leurs sites, afin de prendre les bonnes décisions. Il s’agit en faite, d’extraire de l’information à p...
متن کاملTâche, domaine et application : influences sur le processus de modélisation de connaissances
Résumé Un nombre croissant d’outils de gestion de documents et de connaissances a désormais recours à des ressources terminologiques et/ou ontologiques (RTO) pour répondre à leurs besoins applicatifs. Nous montrons que le processus de modélisation de telles ressources passe par la prise en compte de la nature du domaine, de la tâche et de l’application visés. Pour cela, nous nous appuyons sur u...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2005